MapReduc相关论文
在全球网络数据高速发展的时代,传统的数据处理方式已经无法满足日益增长的海量数据的处理要求,Hadoop分布式处理平台越来越受到人......
针对并行MRPrePost(parallel prepost algorithm based on MapReduce)频繁项集挖掘算法在大数据环境存在运行时间长、内存占用量大......
云计算集群中的资源存在异构和节点稳定性问题。异构资源的计算能力不同会导致较突出的作业任务同步问题,而某个节点的不稳定状态......
结合云计算平台提出了基于子集统计的关联规则算法,该算法能充分利用云计算的并行性特点,只需要扫描一次数据库,比传统的Apriori算......
Hadoop是一种开源可靠的分布式计算框架,而MapReduce是处理超大规模数据集的编程模型。鉴于Hadoop内置的调度器不能很好地处理类别......
文中针对传统并行K—means聚类算法时间复杂度比较高的问题,结合Hadoop平台以及MapReduce编程模型的优势,提出了利用Hadoop及MapRedu......
大数据的规模效应给数据存储、管理以及数据分析带来了极大的挑战,学界和业界广泛采用分布式文件系统和MapReduce编程模型来应对这......
特征选择已经成为一种对高维数据进行预处理的必不可少的手段.随着数据规模的爆炸性增长,传统的特征选择算法已经不能满足当前高维......
针对供应链环境下制造企业基于海量感知数据的业务处理存在语义异构,同时难以进行集成和高效应用的难题,提出一种本体驱动的分布式信......
摘要:中文分词方法都属于串行分词方法,不能处理海量数据。提出一种基于MapReduce的并行分词方法。Mapreduce编程模型默认使用TextIn......
随着电子商务的快速发展,互联网进入大数据时代,企业对客户需求的精准定位进而进行个性化的推荐,不仅可以培养客户的忠诚度,还能有......
随着我国数字影院的快速发展,影片KDM(密钥传送消息)制作速度慢的瓶颈日益凸显,迫切需要一种快速制作KDM的方法。本文首先介绍了KD......